查看原文
其他

如何造假一篇学术论文?导师看了连夜求我放他一马

毕导 毕导 2022-09-06

最近顶刊《Nature》上的一篇被引用2300多次的论文被发现造假,实验结果图片是PS出来的!

出自《Science》第377卷,6604期
实锤论文中包括了被引2300+次的那篇

据报道,该篇文章是阿尔茨海默症某细分研究领域的一奠基性论文,自2006年发表至今,有很多研究机构据此开展进一步研究,投入了大量的人力财力。这一锤下去,16年的努力都打水漂了!该领域的博士生还咋毕业啊

我对阿尔茨海默症也不咋了解,身为一只科研老狗,看完我更好奇的是:学术造假这么容易吗?把Nature都骗过去了?那毕业论文不是更好糊弄?


于是我回顾了下过往的学术造假案例,看着看着甚至从中扒出了一套学术造假的套路和手段...特此分享给大家用于自我规避,有则改之无则加勉。

但如果你深受启发的话,那你可能是个潜在的学术危险分子!请立刻在评论区自首



1.选择你的造假学科

学术造假也是有门槛的,找到好的赛道才能事半功倍。数理化材生医计,哪门学科更得造假人士的青睐呢?

我找到了一个较权威的撤稿观察网站,输入日期,就能看到这段时间被撤稿论文的数量、标题、发布期刊、撤稿原因等等信息。比如2022年上半年的撤稿文章就高达2584篇,好能撤...

http://retractiondatabase.org/RetractionSearch.aspx

当然这2584篇并不都是因为作者学术造假被撤稿。撤稿原因五花八门,可能是实锤造假,可能是怀疑造假,可能是期刊审核有问题,也可能就是出版商的流程问题...


但根据各学科撤稿比例的高低,也能一定程度上反应各学科“浑水摸鱼”的难度差异经统计得到部分学科比例如下:

有560篇属于盗版会议的论文合订本被撤回,包罗万象啥都有,此处不纳入统计;学科分类以网站标注及期刊属性为准,有些论文为交叉学科产物,处理为各学科计0.5,各打50大板;以上数据仅为个人统计,不代表任何官方结论,仅供粗粗参考。感兴趣的朋友可以自行去网站查询。

由上图我们可以得到很多有趣的结论:

1)生命科学、健康科学荣登“造假”的第一梯队。想一想也很合理,毕竟实验做成啥样,关键往往不在于人,而在于细胞和猴子的心情。而且生命科学实验方案往往复杂,哪怕你对着条件重复,结果都很难一毛一样。

总之,只要实验玄学多,牛逼结论随我说

一眼望去全是生医啊……(向下滑动查看更多)
2)计算机名列“造假”的第二梯队。想一想也很合理,虽然计算机代码数据的可重复性强,但只要代码不开源,我的文章很安全

3)材料、化学位于“造假”的第三梯队。想一想也很合理,材化领域的文章经常像炼丹,无非是一通复杂的反应再拿SEM、TEM、IR、XRD、AFM之类挨个打一遍。只要样本没人查,性能想啥就有啥

4)数学、物理属于“造假”的末流队伍,难堪大用。想一想也很合理,数学有假可言吗?而物理规律往往数学性较强,也很难造假。

细看一眼,数学物理的撤稿要么是搞错了,要么是抄袭,很少有伪造的...想必实在是编不出来吧:


总结下造假容易度,生物/医学>计算机>材料/化学>数学/物理。往哪个方向努力犯错大家都懂了吧

2.想好你的造假层次

造假前大家先扪心自问,你到底想骗过谁?是骗过导师,是骗过审稿人,还是骗过同行乃至这个世界?针对不同的目标人群,你的造假层次就要有所调整。主要分为这三种:

上流——思想上的造假:提出一些崭新的研究思路、乃至开辟一个船新的科学领域,然后不断编织它的美好前景,从而“绑架”更多同行加入研究,成功洗脑整个世界,以一己之力拉跨科研进度二十年。


比如本文开头的阿尔茨海默症造假,手把手打造并倾覆了Aβ56的研究大厦。比如日本的小保方晴子万能细胞造假案(谎称自己掌握了将高度分化的体细胞转变为类似干细胞状态的技术),更是直接把导师坑到自鲨...

中流——领域的小突破:主要是在前人的基础上给细分领域做出一点“贡献”,丰富自己学术成就的同时,给同行制造点压力和困惑。

比如我把浙江萧山聚啊聚化工厂的聚乙烯催化剂生命周期延长了20%,你提出了一种机器学习算法能以98%的准确率区分柴犬和橘猫。这种文章就算发出去都没人读,就算有人读了觉得有问题,也就是关了文章看别的去了。

所以,这种文章即使造了假,它能骗过2-3位审稿人就“安全”了。未来它将永远以学术垃圾的形式存在于web of science无人问津的角落。


末流——自我学术欺骗:俗称瞎JB写一篇毕业论文,只需骗过你身边最亲近的几位导师即可。当我们不学无术多年,临到毕业答辩前才开始在论文里胡说八道,又何尝不是对导师的欺骗但导师对你的爱护、信任、厌倦,足以让他放你一马。


大家觉得哪种造假层次比较刑呢

3、选择你的造假方法

这方面我行得正坐得端,没什么造诣。

但网上有很多案例。通往不归路的途径有很多,这里给大家看看几种已经被捉住的典型造假手法,我感觉都很刑:

1)抄袭

抄,属于最基本的造假方案。你写毕业论文借鉴几句都得降重降到哭,人家抄却能直接抄上SCI,显然很有手段。

其实论文发表主要有两道关卡:查重系统审稿人,二者各有优劣。查重系统数据库大,但不够聪明,微操后的图片、数据,它很可能查不出来;审稿人很聪明,能看出微操,但数据库小,没看过的内容都能过关。

取两者漏洞的交集,显然,挑一些审稿人没看过的冷门图片数据,调整一下,送审,更可能逃出法网。比如这样:

出自期刊《Polymers》

这踏马看着简直一模一样吧!但算法和人眼就是没看出来...直到原作者一波举报,才成功撤稿。果然被抄袭的人最懂抄袭,大家平时也要多水水期刊,看有没有人抄自己的图。让我们做自己的反抄卫士

2)熟练使用PS

图片处理也是论文造假的重灾区。主要就是对图片进行局部或整体的复制、旋转,比如之前曹雪涛院士组里出现过的论文:


另一个案例的动图更明显...

美国癌症专家Carlo Croce博士的造假情况

总之,熟练掌握PS就能抹掉辣鸡的污点,编造亮眼的数据,成就非凡的人生!但P得了图片,P不了实力。想自断前途的朋友,有胆你就来

3)模糊实验过程

很多论文的造假重心就是实验,而实验的造假重心就是模糊!步骤一定不能讲清楚,务必贯彻【最终解释权归我所有】的中心思想。绝不让别人有复现的可能。

举个例子,一个材料学中制膜的实验过程是这么写的(这是篇好文章,我只是拿来瞎举例,没有说它造假的意思)


看起来每一步都很清楚吼!但如果你想复现实验,会发现每一步都有技巧:先泡10分钟,是整个放水里泡?还是只用液体浸透膜表面地泡?室温下放30分钟你的室温是多少?夏天还是冬天?晴天还是雨天?gently地放多绅士算gently?自来水过夜,北京自来水质那么硬能冲膜吗?

当你重复不出对方的数据时,你首先会怀疑自己究竟是哪个步骤没重复对,而不会觉得对方数据有问题。最后你决定发邮件问:你究竟是怎么做出来的?我咋不行?

此时对方只会说:

know-how意为“绝佳妙招”
通常指经积累摸索出的小窍门

而你也会觉得是自己资历浅薄手脚粗笨,才重复不出理想的结果。当大家都怀疑自己而不怀疑原论文时,这个就算造成了。

当然,不是所有模糊的论文都是造假,只是造假的论文往往会显得模糊。这些造假的人为了成果一时模糊,殊不知他们未来的学术生涯,也已因此变得一片模糊。
4)巧妙处理数据

数据的好坏也决定着一篇论文能否成型。那遇到数据差的结果怎么办呢?改。

可以往高了改,全体数据×1.2,你看我优化效果多高!可以筛选着改,从一堆辣鸡数据中挑几个好的用,也不算骗吧!实在不行就硬改,别问为什么,我做出来就这样!一通自然地修改,直接改上《自然》!

名古屋大学的矢野裕太就是这么干的,他的研究号称突破了世界难题!看这花花绿绿的数据图表,真了不起!结果全踏马是捏造的,真了不起啊


以上就是四种典型的学术造假手法了!可以说是各有各的花样,但最终都没逃过天下科研人的审判。各位都学废了吗?



结语

本文用反讽的手法盘点了学术界造假乱象,希望大家引以为戒!科研之前,首先应该懂得,什么是“科学伦理”。

一篇医学领域的开创性论文有造假,这波估计学医和不学医的估计都沉默了。开创者自己成为了领域巨匠,宛如一道光指明了方向。实际却是一代一代的科学家跟着文走入无望之地,上百亿的科研经费全部付诸东流,制药公司十多间投入发现无果后想要弃新药的研究...

而全球有5000w阿尔兹海默病人,这群研究者为了治愈这5000w病人的努力,原来都建立在PS之上。这是多么的可怕荒唐。

当造假的科研成果,落到每个后继的科研人头上,同样是毁灭性的。

最优秀的学生经过了十几年的学习终于熬到硕博了,终于要用所学知识大展拳脚了。看着前辈的参考文献想着继往开来,结果发现实验完全无法重复,成果怎么都做不出来,鏖战几个月甚至几年发现还是颗粒无收,谁心里不会自我质疑:

人家都做出来了,怎么我不可以?哪里出错了?为什么照着配方我都做不好?是不是我太菜了?

虽然有时候自己确实菜如果那篇数据根本就是编的,没法复现,那这还怎么玩?究竟是我不行,还是这东西本来就不行?实际上,从他们选定这个方向的一开始,就注定了科研生涯的终结。

这又是多么的可怕荒唐。也是我们对学术造假如此深恶痛绝的原因。

我想,科学是建立在科学之上的。正如我们从小写作文都会用牛顿的那句“我能看得远,是因为站在巨人的肩膀上”,如果巨人本身是个虚壳,我们还能够看得远吗?我们还能看得见吗

希望学术界不要再有这样的“巨人们”,也希望有一天当有人要站在我们的肩膀上时,我们能坚定结实地托起他们。

留言区福利
1楼可获得罗翔老师《刑法学讲义》一本
15楼可获得不能摸但能吃的鱼一条
29楼可获得能锤造假的锤子一把

真的假不了,假的真不了

您可能也对以下帖子感兴趣

文章有问题?点此查看未经处理的缓存